Google Cloud Platform

  • 구글 클라우드는 구글의 데이터센터 인프라를 기반으로 컴퓨트, 스토리지, 네트워킹, 머신러닝 등의 서비스를 제공하는 글로벌 클라우드
  • Regions : Central US, Western Europe, East Asia 존재하며 세부적으로 zones으로 구성

구글 클라우드만의 특징

  • 빅데이터와 머신러닝 서비스
  • 구글 전용 네트워크를 이용한 글로벌 커버리지
  • 저렴한 가격 모델

Google Cloud Platform Services

1. Big data services

Data Analysis

BigQuery

  • 대규모 저장 및 분석 플랫폼으로 일종의 데이터 웨어하우스, 문법은 SQL와 유사
  • 속도에 최적화되어 있음

빅쿼리 시작하기

Kubernetes, Redis, BigQuery를 이용한 실시간 분석

Batch and streaming data processing

Cloud Dataflow

  • 아파치 스파크, 플링크와 같이 실시간 스트리밍 분석 및 배치 분석을 지원
  • 수집한 데이터를 변환하거나 여러 데이터 소스와 저장소간의 연결(라우팅)을 담당
  • ETL(extract - transform - load) 업무에도 좋음

Asynchronous messaging

Cloud Pub/Sub

  • 비동기(asyn) 메세징 서비스
  • 카프카와 같은 대규모 큐잉 시스템으로 데이터를 대규모로 수집

ETC

Cloud Datalab

  • Jupyter notebook의 클라우드 버전
  • 웹 기반의 저작 도구

Dataproc

  • 하둡 / 스파크의 매니지드 서비스로 클러스터를 90초안에 배포

Data Studio

  • SQL / 빅쿼리 등의 데이터 소스를 기반으로 시각적인 보고서를 생성해주는 제품

영어 단어

  • underlying : (외부로 드러나지 않는) 근본적인

In [ ]: